☰
13.2.2 Semi-Markov Decision Process (SMDP): 가변적인 시간 간격을 다루기 위한 MDP의 확장 이론
Home
/
인공지능 (Artificial Intelligence, AI)
/
제목: Embodied AI & Modern Control
/
Chapter 13. 계층적 강화학습과 스킬 발견 (Hierarchical RL & Skill Discovery)
/
13.2 옵션 프레임워크와 SMDP (The Options Framework & SMDP)
/
13.2.2 Semi-Markov Decision Process (SMDP): 가변적인 시간 간격을 다루기 위한 MDP의 확장 이론
13.2.2 Semi-Markov Decision Process (SMDP): 가변적인 시간 간격을 다루기 위한 MDP의 확장 이론